01. Pandas 简介

Pandas 简介

Pandas 是 Python 中的数据操纵和分析软件包。名称“Pandas”得名自计量经济学 Panel Data (面板数据)一词。Pandas 为 Python 带来了两个新的数据结构,即 Pandas Series Pandas DataFrame 。借助这两个数据结构,我们能够轻松直观地处理 带标签 数据和 关系 数据。这些课程将简单介绍 Pandas,并讲解一些最重要的 Pandas 功能。

在下面的课程中,你将学习:

  • 如何导入 Pandas
  • 如何使用各种方法创建 Pandas Series 和 DataFrame
  • 如何访问及更改 Series 和 DataFrame 中的元素
  • 如何对 Series 执行算术运算
  • 如何向 DataFrame 中加载数据
  • 如何处理非数 (NaN) 值

学习以下课程的前提是你已经熟悉 NumPy,并且已经学习了之前的 NumPy 课程。因此,为了避免重复讲解,我们将忽略已经在 NumPy 课程中介绍过的大量细节内容。如果你尚未学习 NumPy 课程,建议先学习这些课程。

下载 Pandas

Anaconda 中包含 Pandas。如果你的计算机尚未安装 Anaconda,请参阅 Anaconda 部分,详细了解如何在 PC 或 Mac 设备上安装 Anaconda。

Pandas 版本

和很多 Python 软件包一样,Pandas 也会时不时地更新。以下课程在制作时采用的是 Pandas 0.22 版。你可以检查你的 Pandas 版本:在 Jupyter notebook 中输入 !conda list pandas ,或在 Anaconda 提示符处输入 conda list pandas 。如果你的计算机安装的是另一个版本的 Pandas,你可以通过在 Anaconda 提示符处输入 conda install pandas=0.22 更新你的 Pandas 版本。随着新版 Pandas 的推出,一些功能可能会过时或被替换掉,因此确保在运行代码前,安装正确的 Pandas 版本。这样可以保证代码顺利运行。

Pandas 文档

Pandas 是一个强大的数据分析库,其中包含很多函数和功能。在这些入门课程中,我们将仅介绍 Pandas 的一些基本功能。如果你想深入学习 Pandas,确保参阅 Pandas 文档:

Pandas 文档